你知道蛋白质组与转录组相关性差的原因吗 | 翻译组
在细胞内存在着成千上万种不同的蛋白质,几乎所有生命活动的执行都离不开它。我们都知道,蛋白质是从mRNA翻译而来(图1)。然而,做过转录组和蛋白质组的人,常会困扰于下面的状况:
1)明明这个基因在处理组是上调(或下调)的,可用iTRAQ定量后发现对应的蛋白却是相反变化的或是差异不显著的?
2)这个基因在处理组中是有显著差异变化的,而且表达水平较高,可却没在蛋白质组数据中找到对应的蛋白?
3)转录组与蛋白质组的整体相关性总比预期低得多?
问题出在哪儿?实验上?数据分析上?都不是。
图1 遗传信息从基因组传递到蛋白质组
真正的原因在于,从转录组到蛋白质组要经历一个复杂且精细的调控阶段,这个调控不是我们常说的转录后调控,而是翻译调控(Translation Regulation)。早在2011年Nature上的一项研究就指出,细胞中的蛋白丰度主要由翻译水平控制,蛋白无论在半衰期、合成速率、还是数量上都与mRNA存在明显的差异(图2)[1]。翻译并不是简单地把mRNA的信息照搬照抄,而是对这些信息进行了全局且精细地再编排。这种编排的直接结果是,转录本丰度≠蛋白质丰度。蛋白质组与转录组的槽糕相关性原来是翻译调控惹的“祸”。而且翻译调控的作用远不止这样,比如翻译速度会决定蛋白质的折叠构象,更可能决定蛋白质的定位与功能;翻译起始效率可以决定蛋白质的产量及其所对应的细胞表型等等。
图2 蛋白质比mRNA具有更长的半衰期,更高数量级的丰度
a.mRNA的平均细胞半衰期中位数是9h,而蛋白质的高达46h
b.mRNA在细胞内平均拷贝数的中位数是17,而蛋白质的高达16,000
对翻译调控的研究即为翻译组学(translatome)。广义的翻译组指直接参与翻译过程的所有元件,包括但不限于核糖体、正在翻译的mRNA(translating mRNA)、tRNA、调控性RNA(如miRNA、 lncRNA等)、新生肽链(nascent polypeptide chain)、各种翻译因子等;狭义的翻译组特指正在翻译的mRNA(图3)。对翻译组的研究,会帮助我们
1)解开翻译调控的复杂机制,
2)发现未知蛋白质(包括漏检蛋白和一些非编码RNA编码的蛋白),
3)更好地解释和衔接转录组与蛋白质组的结果等等。
图3 翻译组的构成元件
采用翻译组测序又称核糖体印记测序(Ribosome profiling,或Ribo-seq),可以对正在翻译的mRNA进行检测[2]。Ribosome profiling是针对与核糖体结合,长度约为30nt,正在翻译的mRNA片段进行富集、测序和定量(图4)。据此获取每种转录本上核糖体的分布,并可推测起始密码子位置(包括非ATG起始)以及uORFs等信息。
图4 Ribosome profiling vs mRNA sequencing
翻译组是衔接转录组与蛋白质组的关键一环,我们将从多个角度为大家揭开她的神秘面纱。下一期介绍几种翻译组的检测方法和各自的特点。
✕✕参考文献
1. Schwanhausser B, Busse D, Li N, et al. Global quantifcation of mammalian gene expression control. Nature, 2011, 473(7347): 337-342.
2. Ingolia NT, Ghaemmaghami S, Newman JR, et al. Genome-wide analysis in vivo of translation with nucleotide resolution using ribosome profling. Science, 2009, 324(5924): 218-223.